import pandas as pd

# 写你自己的文件路径！
filepath=r'D:\PYCHARM文件\zwz050418\main\house-info.csv'
df = pd.read_csv(filepath, encoding='utf-8')

# ['网址', '总价', '建筑面积', '户型', '单价', '楼层', '朝向', '装修程度', "地区", '建筑年代','有无电梯',
#                 '产权性质', '住宅类别', '建筑结构', '挂牌时间', '建筑形式', '车库数量', '车位数量']

#初步探索性结果
print(f'样本量共有 {df.shape[0]} 个!')
print("-"*50)
#判断是否有重复项
print("重复项：\n",df.duplicated().sum())
print("-"*50)
#判断是否有缺失值
print("缺失值：\n",df.isnull().sum())
print("-"*50)
#查看数据类型
print("数据类型：\n",df.dtypes)
print("-"*50)
#唯一标签值
print(df['朝向'].unique())
print("-"*50)
print(df['楼层'].unique())
print("-"*50)
print(df['地区'].unique())
print("-"*50)
print(df['装修程度'].unique())
print("-"*50)
print(df['产权性质'].unique())
print("-"*50)
print(df['住宅类别'].unique())
print("-"*50)
print(df['建筑结构'].unique())
print("-"*50)
print(df['建筑形式'].unique())
print("-"*50)
print(df['建筑年代'].unique())
print("-"*50)